Regroupement bayesien variationnel des locuteurs

نویسندگان

Fabio Valente

Christian Wellekens

چکیده

In this paper we explore the use of Variational Bayesian (VB) learning in unsupervised speaker clustering. VB learning is a relatively new learning technique that has the capacity of doing at the same time parameter learning and model selection. We run experiments on the NIST 1996 HUB-4 evaluation test for speaker clustering. Two cases are considered : the speaker number is a priori known and it has to be estimated. We evaluate results in terms of average cluster purity and average speaker purity. VB shows a higher accuracy compared to the Maximum Likelihood solution.

برای دانلود رایگان متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Nouvelle approche pour le regroupement des locuteurs dans des émissions radiophoniques et télévisuelles (New approach for speaker clustering of broadcast news) [in French]

RÉSUMÉ Dans cet article, nous proposons un nouveau modèle de regroupement de locuteurs pour la tâche de segmentation et de regroupement de locuteurs. Un des problèmes majeur rencontré dans le regroupement des locuteurs est que les algorithmes d’agglomération hiérarchique utilisés ne garantissent pas de donner une solution optimale. Nous proposons d’exprimer le problème de regroupement des locut...

متن کامل

Détection de locuteurs dans les séries TV

RÉSUMÉ. La segmentation de flux audio en locuteurs apparaît particulièrement délicate lorsqu’elle est appliquée à des films de fiction, où de nombreux personnages parlent dans des conditions acoustiques variables (musique de fond, bruitages, fluctuations dans l’intonation...). Au-delà d’une telle variabilité acoustique, ce type de films exhibe cependant de la régularité sur le plan visuel, part...

متن کامل

Automatic transcription of Broadcast News

This paper describes the IBM approach to Broadcast News Transcription. Typical problems in the Broadcast News Transcription task are segmentation, clustering, acoustic modeling, language modeling and acoustic model adaptation. This paper presents new algorithms for each of these focus problems. Some key ideas include Bayesian Information Criterion (for segmentation, clustering and acoustic mode...

متن کامل

Segmentation en locuteurs d'un document audio

R esum e: Dans cet article, nous abordons le probl eme de la segmentation en locuteurs. Le but est d'obtenir des segments de locuteurs homog enes, c'esta-dire ne contenant les paroles que d'un seul et même locuteur. Ces segments doivent être les plus longs possible. Dans notre etude, nous faisons les hypoth eses qu'aucune connaissance a priori sur les locuteurs n'est disponible et que les perso...

متن کامل

Identification des locuteurs par regroupement hiérarchique ascendant et modèles d’ancrage

The process of speaker recognition is generally based on modeling the characteristics of each speaker. An interesting method for modeling consists in representing a new speaker, not in an absolute manner, but relatively to a set of well trained speakers. Each speaker is represented by its location in an optimal space of eigen or virtual voices. We hope that the relative position of a speaker in...

متن کامل

ذخیره در منابع من

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

عنوان ژورنال:

دوره شماره

صفحات -

تاریخ انتشار 2004

Regroupement bayesien variationnel des locuteurs

نویسندگان

چکیده

منابع مشابه

Nouvelle approche pour le regroupement des locuteurs dans des émissions radiophoniques et télévisuelles (New approach for speaker clustering of broadcast news) [in French]

Détection de locuteurs dans les séries TV

Automatic transcription of Broadcast News

Segmentation en locuteurs d'un document audio

Identification des locuteurs par regroupement hiérarchique ascendant et modèles d’ancrage

عنوان ژورنال:

اشتراک گذاری